Text copied to clipboard!

Název

Text copied to clipboard!

Inženýr spolehlivosti webu SRE

Popis

Text copied to clipboard!
Hledáme inženýra spolehlivosti webu, který se připojí k našemu týmu a pomůže nám zajistit stabilitu, škálovatelnost a vysokou dostupnost našich webových aplikací a služeb. Tento odborník bude úzce spolupracovat s vývojáři, provozními týmy a dalšími technickými specialisty na navrhování, implementaci a správě systémů, které podporují naše klíčové produkty a služby. Vaší hlavní odpovědností bude udržovat provozuschopnost systémů, automatizovat procesy, monitorovat výkon a reagovat na incidenty. Budete se podílet na vývoji nástrojů a skriptů pro zajištění efektivního provozu a budete hrát klíčovou roli při zavádění osvědčených postupů v oblasti DevOps a Site Reliability Engineering (SRE). Ideální kandidát má silné technické znalosti v oblasti správy systémů, cloudových technologií, skriptování a monitorovacích nástrojů. Měl by být schopen rychle identifikovat a řešit problémy, navrhovat preventivní opatření a přispívat k neustálému zlepšování infrastruktury. Tato pozice je ideální pro někoho, kdo má vášeň pro automatizaci, optimalizaci a zajištění bezproblémového chodu rozsáhlých systémů. Pokud hledáte výzvu v dynamickém prostředí a chcete mít přímý dopad na kvalitu a dostupnost služeb, které používají miliony uživatelů, pak je tato role právě pro vás.

Odpovědnosti

Text copied to clipboard!
  • Monitorování a zajištění dostupnosti webových služeb
  • Automatizace opakujících se úloh a procesů
  • Řešení incidentů a analýza příčin výpadků
  • Spolupráce s vývojáři na zlepšení spolehlivosti aplikací
  • Návrh a implementace škálovatelných systémů
  • Zavádění a správa monitorovacích a alertovacích nástrojů
  • Zajištění bezpečnosti a souladu s předpisy
  • Vytváření a údržba dokumentace infrastruktury
  • Podpora CI/CD procesů
  • Zlepšování výkonu a optimalizace systémů

Požadavky

Text copied to clipboard!
  • Zkušenosti s Linux/Unix systémy
  • Znalost cloudových platforem (např. AWS, GCP, Azure)
  • Zkušenosti s nástroji jako Prometheus, Grafana, ELK stack
  • Schopnost skriptovat v jazycích jako Bash, Python nebo Go
  • Znalost kontejnerizace (Docker, Kubernetes)
  • Zkušenosti s CI/CD nástroji (např. Jenkins, GitLab CI)
  • Schopnost analyzovat a řešit problémy v produkčním prostředí
  • Znalost principů DevOps a SRE
  • Dobré komunikační schopnosti a týmová spolupráce
  • Angličtina na technické úrovni

Potenciální otázky na pohovor

Text copied to clipboard!
  • Jaké máte zkušenosti s monitorováním a alertováním systémů?
  • Jak byste řešil(a) výpadek produkční služby?
  • Jaké nástroje používáte pro automatizaci?
  • Jaké cloudové platformy jste používal(a) a v jakém rozsahu?
  • Jaké jsou vaše zkušenosti s Kubernetes?
  • Jak přistupujete k zajištění vysoké dostupnosti systémů?
  • Jaké metriky považujete za klíčové pro sledování výkonu?
  • Jaké skriptovací jazyky ovládáte a jak je používáte?
  • Jaké máte zkušenosti s CI/CD procesy?
  • Jak byste zlepšil(a) spolehlivost existující aplikace?